vc x86.mis

c++ - 错误 X8000 : D3D11 Internal Compiler error : Invalid Bytecode: Invalid operand type for operand #1 of opcode #86 (counts are 1-based)

我和我的讲师/实验室助理都被难住了。出于某种原因，以下HLSL代码在输出窗口中返回:errorX8000:D3D11InternalCompilererror:InvalidBytecode:Invalidoperandtypeforoperand#1ofopcode#86(countsare1-based).这是HLSL中导致问题的函数://ProjectsaspherediameterlargeinscreenspacetocalculatedesiredtesselationfactorfloatSphereToScreenSpaceTessellation(float3p0,f

c++ - 使用 OpenMP 的 x86 上的原子最小值

OpenMP是否支持C++11的最小原子性？如果OpenMP没有可移植的方法:是否有某种方法可以使用x86或amd64功能来实现？在OpenMP规范中，我没有找到任何适用于C++的内容，但Fortran版本似乎支持它。详见v3.1的2.8.5。对于C++，它声明binopisoneof+,*,-,/,&,^,|,>.但是对于Fortran来说intrinsic_procedure_nameisoneofMAX,MIN,IAND,IOR,orIEOR.如果您对更多上下文感兴趣:我正在寻找一种执行以下操作的无互斥方法:vectorlock;vectorval;#pragmaompparal

amp OpenMP section code blockquote c++x86 atomic minimum

c++ - 如何从数据缓冲区执行 x86 命令？

我的问题主要针对教授，是关于以“奇怪”的方式使用C++。在C++中，变量指针和函数指针之间并没有太大区别。我们可以像这样做一些无用的事情:char*buff=newchar[32];void(*func)()=(void(*)())buff;但我们几乎创建了一个从未存在过的函数，对吧？如果我们更进一步，在文件中用x86命令stord填充buff会怎样？操作系统永远不会知道函数已创建。#includeusingnamespacestd;//nostackpush'ingorpop'ing,nothingtoreturnvoidfunc(void){cout调用x86_func()会产生运

amp 43 code section void c++module x86

c++ - 循环地址对齐如何影响 Intel x86_64 上的速度？

我看到编译为完全相同的机器指令但位于不同对齐地址的相同C++代码的性能下降了15%。当我的微型主循环从0x415220开始时，它比从0x415250开始时更快。我在IntelCore2Duo上运行它。我在x86_64Ubuntu上使用gcc4.4.5。谁能解释减速的原因以及我如何强制gcc以最佳方式对齐循环？下面是两种情况的反汇编，带有探查器注释:41522057612.56%|XXXXXXXXXXXXXX48c1eb08shr$0x8,%rbx4152241102.40%|XX0fb6c3movzbl%bl,%eax4152270.00%|410fb60400movzbl(%r8,%

amp Intel strong 0.00%section c++optimization gcc x86-64

c++ - ld : symbols not found for architecture x86_64, clang: 链接器命令失败

我正在尝试使用Homebrew软件下载和构建诸如boost、ceres-solver之类的软件包。发生的事情是我将尝试编译代码，没有任何特殊标志(g++foo.cpp-ofoo-I/usr/local/...并且我也尝试过clang++)并且我始终收到此错误:Undefinedsymbolsforarchitecturex86_64:...ld:symbol(s)notfoundforarchitecturex86_64clang:error:linkercommandfailedwithexitcode1(use-vtoseeinvocation)所以我环顾四周，解决方案是使用-st

architecture amp ceres double const c++macos c++11 homebrew clang++

c++ - 在 x86-64 中访问 32 位整数数组是否存在性能损失？

对不起，如果这个问题听起来很愚蠢。我只是模糊地认识到数据对齐问题，并且从未进行过任何64位编程。我现在正在处理一些32位x86代码。它经常访问一个int数组。有时会读取一个32位整数。有时会阅读两个或更多。在某些时候，我想将代码设为64位。我不确定是否应该将此int数组声明为int或longint。我宁愿保持整数的宽度相同，所以我不必担心差异。我有点担心读取/写入与自然词不对齐的地址可能会很慢。最佳答案仅当加载或存储越过对齐边界时才会发生未对齐惩罚。边界通常是以下较小者:硬件的自然字长。(32位或64位*)数据类型的大小。如果您

amp 43 section 担心不必 c++c x86-64

c++ - *** 没有规则使目标 'class.cpp' 需要 `build/....x86/class.o` 停止。 Ubuntu 中的错误

我在尝试构建和编译我的程序时遇到了这个错误。现在我无法在程序中打开所有.cpp文件。make[2]:*NoruletomaketargetChecker.cpp',neededbybuild/Debug/GNU-Linux-x86/Checker.o'.Stop.谁能帮我解决这个问题？我检查了所有在线资源，但似乎找不到解决方案。我迫切需要解决这个问题。感谢您提供的任何帮助。最佳答案如果此处没有要制作的文件(Checker.cpp)，则会出现此错误。大概有以下几个原因:你的当前目录不是你的文件所在的目录居住。文件可能已移至其他地方

amp class section code Checker c++compilation gnu-make

c++ - x86_64 上 2 的快速浮点幂

有没有快速取2.0的方法达到某种浮点程度x？我的意思是比pow(2.0,x)更快的东西最好使用AVX2进行矢量化处理。整数对应的是1,但它适用于整数n仅。最佳答案有一个标准std::exp2(doublen)Computes2raisedtothegivenpowern在特定环境下exp2(x)可能不会比pow(2.0,x)快，但它比一般的pow更具体。关于c++-x86_64上2的快速浮点幂，我们在StackOverflow上找到一个类似的问题： ht

amp 43 code section stackoverflow c++floating-point vectorization x86-64 pow

c++ - 导致除法溢出错误 (x86)

我有几个关于x86或x86_64架构上的除法溢出错误的问题。最近我一直在阅读有关整数溢出的内容。通常，当算术运算导致整数溢出时，会设置FLAGS寄存器中的进位位或溢出位。但显然，根据thisarticle，除法运算产生的溢出不会设置溢出位，而是触发硬件异常，类似于除以零时。现在，除法导致的整数溢出比乘法要少得多。只有几种方法可以触发除法溢出。一种方法是做类似的事情:int16_ta=-32768;int16_tb=-1;int16_tc=a/b;在这种情况下，由于有符号整数的补码表示，不能在16位有符号整数中表示正数32768，所以除法运算溢出，导致错误值为-32768。几个问题:1)

amp 43 code 32768 除以 c++c assembly x86 integer-division

c++ - 体系结构 x86_64 : for caffe build 的 undefined symbol

我收到caffe的错误build。我该如何解决？我使用的是MacOSXYosemite10.10.1。控制台日志Machida-no-MacBook-Air:caffemachidahiroaki$/usr/bin/clang++-shared-o.build_release/lib/libcaffe.so.build_release/src/caffe/proto/caffe.pb.o.build_release/src/caffe/proto/caffe_pretty_print.pb.o.build_release/src/caffe/blob.o.build_release/s

amp undefined build_release release caffe c++macos opencv osx-yosemite

68 69 707172 73 74